I giochi olimpici dell’era moderna sono parte della nostra storia da ormai più di 120 anni. Attraverso questa analisi andrò ad approfondire come si sono evoluti nel tempo. In particolare vedremo:
Per effettuare l’analisi ho utilizzato principalmente due datasets. Il primo atleti_eventi,di cui riporto le prime righe, è caratterizzato da 271116 osservazioni e 14 variabili che descrivono l’atleta nelle sue caratteristiche fisiche,il comitato olimpico di appartenenza, l’evento olimpico cui ha partecipato, lo sport praticato e la madeglia eventualmente vinta.
| ID | Name | Sex | Age | Height | Weight | Team | NOC | Year | Season | City | Sport | Event | Medal |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | A Dijiang | M | 24 | 180 | 80 | China | CHN | 1992 | Summer | Barcelona | Basketball | Basketball Men’s Basketball | Nessuna |
| 2 | A Lamusi | M | 23 | 170 | 60 | China | CHN | 2012 | Summer | London | Judo | Judo Men’s Extra-Lightweight | Nessuna |
| 3 | Gunnar Nielsen Aaby | M | 24 | NA | NA | Denmark | DEN | 1920 | Summer | Antwerpen | Football | Football Men’s Football | Nessuna |
| 4 | Edgar Lindenau Aabye | M | 34 | NA | NA | Denmark/Sweden | DEN | 1900 | Summer | Paris | Tug-Of-War | Tug-Of-War Men’s Tug-Of-War | Gold |
| 5 | Christine Jacoba Aaftink | F | 21 | 185 | 82 | Netherlands | NED | 1988 | Winter | Calgary | Speed Skating | Speed Skating Women’s 500 metres | Nessuna |
| 5 | Christine Jacoba Aaftink | F | 21 | 185 | 82 | Netherlands | NED | 1988 | Winter | Calgary | Speed Skating | Speed Skating Women’s 1,000 metres | Nessuna |
Il secondo noc_regions costituito da 3 variabili e 230 osservazioni. In particolare è costituito da 230 NOC (codici dei comitati olimpici nazionali),dalle nazioni ad essi collegati ed eventuali note.Lo useremo per rilevare lo Stato di appartenenza dell’atleta.
| NOC | region | notes |
|---|---|---|
| AFG | Afghanistan | NA |
| AHO | Curacao | Netherlands Antilles |
| ALB | Albania | NA |
| ALG | Algeria | NA |
| AND | Andorra | NA |
| ANG | Angola | NA |
Infine durante l’analisi ci serviremo di due dataset ausiliari per alcune analisi grafiche. Uno descrive il PIL per ogni nazione e l’altro associa ad ogni nazione il rispettivo continente di appartenenza e la capitale.
Tutti i dataset utilizzati sono disponibili su Kaggle.
N.B Quando parlerò di Olimpiadi farò riferimento esclusivamente ai Giochi olimpici estivi.
I giochi olimpici si suddividono in estivi ed invernali. Quelli estivi sono più comunemente chiamate Olimpiadi è sono nate nel 1896 e si sono tenute ad Atene, mentre quelli invernali sono nati nel 1924 e si sono tenuti a Chamonix. A partire dal 1994 si disputano a due anni di distacco da quelle estive. Nel 1906 vennero introdotti i giochi olimpici intermedi (edizione unica) per festeggiare il decimo anniversario del ripristino dei giochi olimpici.I Giochi intermedi non vengono assolutamente considerati come edizione ufficiale dei Giochi olimpici e la loro numerazione non è compresa in quella delle edizioni dei Giochi olimpici. Ciononostante, il successo di questa edizione si rivelò molto importante per il movimento olimpico, dopo i parziali insuccessi della II e della III Olimpiade.
| Year | Season | City |
|---|---|---|
| 1896 | Summer | Athina |
| Year | Season | City |
|---|---|---|
| 1924 | Winter | Chamonix |
| Year | Olimpic Games |
|---|---|
| 1896 | 1 |
| 1900 | 1 |
| 1904 | 1 |
| 1906 | 1 |
| 1908 | 1 |
| 1912 | 1 |
| 1920 | 1 |
| 1924 | 2 |
| 1928 | 2 |
| 1932 | 2 |
| 1936 | 2 |
| 1948 | 2 |
| 1952 | 2 |
| 1956 | 2 |
| 1960 | 2 |
| 1964 | 2 |
| 1968 | 2 |
| 1972 | 2 |
| 1976 | 2 |
| 1980 | 2 |
| 1984 | 2 |
| 1988 | 2 |
| 1992 | 2 |
| 1994 | 1 |
| 1996 | 1 |
| 1998 | 1 |
| 2000 | 1 |
| 2002 | 1 |
| 2004 | 1 |
| 2006 | 1 |
| 2008 | 1 |
| 2010 | 1 |
| 2012 | 1 |
| 2014 | 1 |
| 2016 | 1 |
Osserviamo l’andamento dei partecipanti nei vari anni
Figura 1
Dalla Figura 1 è possibile osservare come il numero delle partecipanti donne è sempre stato inferiore al numero degli uomini.Le donne hanno iniziato a partecipare ai Giochi dal 1900. Il numero dei partecipanti è maggiore per le olimpiadi estive che al 2016 si aggira su oltre i 10000 atleti totali, rispetto ai partecipanti dei giochi invernali che non raggiungono i 3000 atleti totali; un fattore è il ridotto numero di categorie sportive presenti nella statione invernale, infatti dal barplot vediamo come si distribuisce il numero delle categorie di sport in gara negli anni.In generale, per entrambe le stagioni l’andamento della partecipazione è crescente.
Guardiamo più da vicino il grafico superiore
Figura 2
Ciò che colpisce osservando il grafico è che ci sono significativi cali nella partecipazione alle Olimpiadi in determinate edizioni. Mi chiedo se questa è una casualità o se eventuali avvenimenti geopolitici si riflettono su tale manifestazione. Andiamo a vedere!
Importanti cali nella partecipazione si hanno nel 1932,1956,1980.
Alle Olimpiadi del 1932 il numero degli atleti è stato inferiore rispetto al trend crescente, perchè erano gli anni del crollo della borsa di New York,“Il venerdì nero“, che di riflesso colpì anche le economie europee. Gli stipendi traballavano e la gente era poco propensa ad esaltarsi per l’Olimpiade.Inoltre,vista la posizione di Los Angeles, in quegli anni non c’erano i mezzi odierni per poterla raggiungere con facilità e molti atleti dovettero rinunciare. Gli atleti russi invece dopo la rivoluzione del 1917 non parteciparono ai Giochi fino al 1952 dove si presentarono come Unione Sovietica.
| Città | Partecipanti | Nazioni |
|---|---|---|
| Los Angeles | 1922 | 47 |
| nazioni | n° atleti | % |
|---|---|---|
| USA | 474 | 24.66 |
| Japan | 157 | 8.17 |
| Germany | 145 | 7.54 |
| Italy | 112 | 5.83 |
| UK | 107 | 5.57 |
Ancora una volta il momento storico sembrò poco congeniale per confermare gli entusiasmi degli sportivi, a causa delle tensioni belliche attorno al canale di Suez e dell’occupazione dell’Ungheria da parte dell’esercito sovietico.
| Città | Partecipanti | Nazioni |
|---|---|---|
| Melbourne | 3347 | 71 |
| nazioni | n° atleti | % |
|---|---|---|
| USA | 305 | 9.11 |
| Australia | 298 | 8.90 |
| Russia | 281 | 8.40 |
| UK | 197 | 5.89 |
| Germany | 167 | 4.99 |
Nei gennaio del 1980 l’Unione Sovietica inviò le proprie truppe in Afghanistan per sostenere un governo filo-sovietico instauratosi pochi mesi prima con un colpo di Stato. Negli Stati Uniti intanto nell’autunno dello stesso anno si sarebbero svolte le elezioni presidenziali. Il presidente democratico Jimmy Carter, anche per riguadagnarsi un po’ di popolarità, iniziò a promuovere un boicottaggio delle Olimpiadi di Mosca e in poco tempo lanciò il suo messaggio: se l’URSS non avesse ritirato le sue truppe dall’Afghanistan entro giugno gli Stati Uniti non avrebbero partecipato alle imminenti Olimpiadi moscovite. L’Unione Sovietica non pensò neanche lontanamente di ritirare i suoi carri armati dall’Afghanistan e così gli USA mantennero la loro promessa e non si presentarono ai Giochi.
| Città | Partecipanti | Nazioni |
|---|---|---|
| Moskva | 5259 | 80 |
| nazioni | n° atleti | % |
|---|---|---|
| Russia | 489 | 9.30 |
| Germany | 346 | 6.58 |
| Poland | 306 | 5.82 |
| Bulgaria | 271 | 5.15 |
| Hungary | 263 | 5.00 |
Alle Olimpiadi del 2016, in assenza di problemi geopolitici importanti, si osserva una partecipazione più omogenea dell’intero mondo.
| Città | Partecipanti | Nazioni |
|---|---|---|
| Rio de Janeiro | 11179 | 203 |
| nazioni | n° atleti | % |
|---|---|---|
| USA | 555 | 4.96 |
| Brazil | 462 | 4.13 |
| China | 429 | 3.84 |
| Australia | 420 | 3.76 |
| Germany | 418 | 3.74 |
Da un confronto con la situazione attuale è immmediato affermare che gli eventi politici hanno influenzato una manifestazione di importanza mondiale. Per quanto riguarda l’ importanza della posizione della città in cui si sono tenuti i giochi, possiamo andare a confrontare la partecipazione per città ospitante nei vari anni.In questo grafico sono riportate solo le città che hanno ospitato i giochi più di una volta.
Figura 3
Osserviamo che vi è sempre un incremento della partecipazione al crescere degli anni tranne in un caso. Il quadrato delimitato sull’ asse x dall’anno 1950 (che possiamo considerare anno limite per il fattore mezzi di trasporto inefficienti) e sull’ asse y da atleti 5000 è la zona in cui si posizionano tutte le prime edizioni dei Giochi.Le edizioni successiove se avvenute prima del 1950 sono rimaste nel quadrato, se dopo, si sono posizionate,gran parte, in alto a destra dell’area del grafico. Eccezioni sono San Moritz, Innsbruck e Lake Placid dove si sono svolte olimpiadi invernali e abbiamo visto che il numero dei partecipanti non supera i 3000; in ogni caso l’andamento è crescente. Infine,Stoccolma pur essendo una città europea, dunque centrale, ha avuto un calo dei partepanti, non dovuto al fattore distanza e al fattore assenza di mezzi di trasporto efficienti, bensì il 1956 era uno di quegli anni con problemi politici. Non possiamo affermare con certezza che la posizione in cui si tiene l’evento olimpico non sia influente, in quanto poche sono le città in cui i giochi si sono tenuti più di una volta.In generale l’andamento è sempre crescente, dovuto sicuramente al miglioramento dei mezzi di trasporto che fa si che la posizione non sia più un problema rilevante.
La domanda sembra scontata e vien semplice pensare che quanti più atleti si portano in gara tanto maggiori sono le possibilità di vincere una medaglia.Ipotizzando così una relazione di tipo proporzionale,lineare.Ma i dati ci diranno molto di più! Osserviamo come si sono distribuite le vittorie nel corso degli anni al variare della numerosità dei comitati olimpici.Man mano che ci si avvicina al 2016 la distribuzione tende ad essere di tipo esponenziale.
Figura 4
Possiamo dunque pensare ad una relazione di dipendenza tra il numero di medaglie vinte e il numero di atleti. Non possiamo applicare una regressione lineare perchè c’è una relazione esponenziale; per questo vado a testare la significatività della dipendenza attraverso un modello di regressione di Poisson.
Non posso considerare i dati come se fossero di tipo cross-section per stimare il modello, perchè per questo tipo di dati c’è una forte dipendenza dal tempo.In quanto, per esempio,nei giochi olimpici la tecnologia ha portato dei miglioramenti nelle performance degli atleti e quindi incrementato le vittorie Per questo prendiamo in considerazione gli anni 1992,1996,2000 e 2016 in cui c’è una partecipazione pressochè costante. E andiamo a studiare una relazione di questo tipo:
\(Medaglie=exp(\beta_0+\beta_1*atleti)\)
Modello per il 1992
##
## Call:
## glm(formula = medals ~ atleti, family = poisson(link = sqrt),
## data = df)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -6.1811 -1.1514 -0.9103 -0.2316 8.1565
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.4850807 0.0438243 11.07 <2e-16 ***
## atleti 0.0235047 0.0003224 72.90 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 7624.92 on 169 degrees of freedom
## Residual deviance: 779.04 on 168 degrees of freedom
## AIC: 1052.4
##
## Number of Fisher Scoring iterations: 6
Modello per il 1996
##
## Call:
## glm(formula = medals ~ atleti, family = poisson(link = sqrt),
## data = df)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -5.8865 -0.9533 -0.7300 0.1129 6.7912
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.3846726 0.0407088 9.449 <2e-16 ***
## atleti 0.0263101 0.0003754 70.085 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 6791.18 on 196 degrees of freedom
## Residual deviance: 578.66 on 195 degrees of freedom
## AIC: 886.01
##
## Number of Fisher Scoring iterations: 7
Modello per il 2000
##
## Call:
## glm(formula = medals ~ atleti, family = poisson(link = sqrt),
## data = df)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -5.8713 -1.0006 -0.8533 -0.1050 8.3776
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.499248 0.040266 12.40 <2e-16 ***
## atleti 0.026034 0.000362 71.92 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 7283.04 on 199 degrees of freedom
## Residual deviance: 763.49 on 198 degrees of freedom
## AIC: 1087.5
##
## Number of Fisher Scoring iterations: 7
Modello per il 2016
##
## Call:
## glm(formula = medals ~ atleti, family = poisson(link = sqrt),
## data = df)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -10.1285 -1.0454 -0.8596 -0.2613 9.6422
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.4764344 0.0400173 11.91 <2e-16 ***
## atleti 0.0262793 0.0003674 71.53 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 7248.91 on 206 degrees of freedom
## Residual deviance: 885.26 on 205 degrees of freedom
## AIC: 1229.5
##
## Number of Fisher Scoring iterations: 7
Tutti i modelli risultano essere significativi con probabilità inferiore allo 0.001 e con una devianza residua non troppo elevata rispetto ai gradi di libertà del modello.Seppur tutta la variabilità non è spiegata solo dal modello.
Intercetta: non ha significato in quanto in assenza di atleti non è possibile vincere medaglie,lo si può interpretare come un valor medio
\(\beta_1\) : ci dice che un incremento di un atleta comporta un incremento del numero di medaglie di \(exp(\beta_1)\)
| Intercetta | Beta1 | medaglieX10atleti | medaglieX20atleti | medaglieX50atleti | medaglieX100atleti |
|---|---|---|---|---|---|
| 0.4851 | 0.0235 | 2.054639 | 2.598930 | 5.259837 | 17.03210 |
| 0.3847 | 0.0263 | 1.911140 | 2.486062 | 5.472306 | 20.38298 |
| 0.4992 | 0.0260 | 2.136566 | 2.770977 | 6.044810 | 22.18020 |
| 0.4764 | 0.0263 | 2.094678 | 2.724814 | 5.997844 | 22.34047 |
Figura 5
Si osservi che passando da 10 a 20 atleti, il numero di medaglie non varia, ma passando da 10 a 50 aumenta di 4, mentre da 10 a 100 incrementa di circa 20. Quindi concludiamo che è vero che il numero di atleti aumenta la possibilità di portare medaglie a casa ma solo da un certo numero in poi.
Abbiamo detto che la relazione sopra analizzata é caratterizzante un preciso anno e ciò che caratterizza la ricchezza di una nazione in un anno e quindi,quante risorse può investire nello sport è il prodotto interno lordo (PIL).Vediamo graficamente se questo può essere un ulteriore fattore di variabilità per le medaglie vinte.
Figura 6
Si osserva, più visibilmente per gli anni delle Olimpiadi, un andamento lineare con le aspettative ossia: gli stati con PIL più elevato vincono di più, collocandosi nella parte in alto a destra dell’area del grafico. Allo stesso tempo si osserva un progressivo avvicinamento degli stati con PIL nettamente più basso verso quelli più ricchi e in alcuni anni addirittura un superamento. Questo è indice della presenza di ulteriori fattori di variabilità che con i dati che abbiamo non riusciamo a spiegare. Potremmo pensare al talento dell’atleta,alle ore di allenamento, al tipo di allenamento e magari alle condizioni climatiche della città in cui si tengono i giochi che favoriscono un tipo d’atleta piuttosto che un altro.
Figura 7
Figura 8
Osserviamo dalla Figura 7 che le nazioni che sono posizionate sul podio sono quelle che negli anni hanno sempre avuto una presenza notevole in termini di partecipanti (Figura 8 guardare le linee più in alto),confermando l’importanza di tale fattore. Gli Stati Uniti nelle ultime sette Olimpiadi si sono classificate al primo posto per medaglie totali e in termini di medaglie d’oro sono molto distanti dal secondo e terzo classificato. Mentre i secondi e terzi classificati hanno pressocchè vinto lo stesso numero di medaglie.
Osserviamo i seguenti grafici:
Figura 9
Lo sport che caratterizza gli USA dal 1992 è il nuoto, seguito da atletica, basket e pallavolo; l’ Australia dal 2004 condivide il nuoto ma si classifica seconda. Il Regno Unito si conferma al 2016 campione di voga e bicicletta. La Germania al 2016 è campione di football e hockey.
Inoltre si può notare che gli USA si sono sempre distinti per nuoto,atletica e basket mentre nazioni come la Cina non focalizzano l’attenzione su un determinato sport, bensì ad ogni edizione salgono sul podio con sport differenti.Questo ci spiega come mai nel punto precedente poche volte abbiamo ritrovato sul podio la Cina e molte volte Stati Uniti e Australia.
Nella tabella seguente si può visualizzare il podio relativo agli sport in cui si sono vinte più medaglie,evidenziando il tipo di medaglia vinta.
| Anno | Nazione | Sport | Oro | Argento | Bronzo | Totale |
|---|---|---|---|---|---|---|
| 1992 | USA | Swimming | 35 | 9 | 12 | 56 |
| 1992 | USA | Athletics | 25 | 13 | 10 | 48 |
| 1992 | Germany | Rowing | 11 | 9 | 22 | 42 |
| 2004 | USA | Swimming | 30 | 22 | 13 | 65 |
| 2004 | USA | Athletics | 18 | 15 | 5 | 38 |
| 2004 | Germany | Hockey | 16 | 0 | 16 | 32 |
| 2012 | USA | Swimming | 41 | 16 | 11 | 68 |
| 2012 | USA | Athletics | 19 | 16 | 7 | 42 |
| 2012 | Australia | Swimming | 7 | 17 | 8 | 32 |
| 2016 | USA | Swimming | 48 | 14 | 9 | 71 |
| 2016 | USA | Athletics | 27 | 10 | 9 | 46 |
| 2016 | Germany | Football | 18 | 17 | 0 | 35 |
Consideriamo atleti di età compresa tra i 18 e i 30 anni
Per un nuotatore maschile il peso medio è di 80Kg e l’altezza è di 185cm Per un nuotatore femminile il peso medio è di 65Kg e l’altezza è di 175cm
Figura 10
Osserviamo che per l’intervallo temporale evidenziato in Figura 10, c’è bassa variabilità sia in senso orizzontale, quindi nel tempo che in senso verticale sia per il Peso che per l’Altezza, questo già ci fa capire che probabilmente non ci sarà alcun tipo di correlazione con il numero di medaglie vinte. Andiamo dunque a guardare il grafico delle correlazioni in Figura 11.
Figura 11
Dal grafico delle correlazioni emerge che vi è una significativa correlazione positiva tra peso e altezza ma nessuna delle variabili Weight,Height,Agespiega la variabilità della variabile di conteggio medaglie(questo lo deduco osservando la bassa percentuale di correlazione con la variabile risposta). Infatti il modello di regressione lineare che ho stimato considerando l’effetto interazione tra peso e altezza spiega meno del 2% della variabilità (tramite R-quadro), pur essendo le variabili significative.
##
## Call:
## lm(formula = medaglie ~ Sex + Weight:Height, data = sport_table)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.39766 -0.18161 -0.14403 -0.09816 1.00321
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.295e-01 2.474e-02 -5.235 1.69e-07 ***
## SexM -1.173e-01 1.182e-02 -9.923 < 2e-16 ***
## Weight:Height 2.753e-05 2.207e-06 12.475 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.3627 on 8040 degrees of freedom
## Multiple R-squared: 0.01929, Adjusted R-squared: 0.01904
## F-statistic: 79.05 on 2 and 8040 DF, p-value: < 2.2e-16
Questo è positivo perchè ci dice che ad oggi non sono queste tre caratteristiche a differenziare un atleta dall’altro.Non rappresentano alcun vantaggio proprio perchè gli atleti di questa categoria si presentano con la stessa età e conformazione fisica.
Per i professionisti di atletica maschili e femminili il peso medio è rispettivamente di circa 70Kg e 60Kg con una notevole presenza di valori esterni dovuti alle caratteristiche richieste in determinate categorie dell’ atletica. Dalla distribuzione dell’ alteza osserviamo che alle donne corrispondono in media 170cm e agli uomini 180cm con pochi valori esterni.
Figura 12
Per quanto rigurda le correlazioni e il modello rimangono valide le considerazioni fatte in precedenza.
Figura 12
##
## Call:
## lm(formula = medaglie ~ Sex + Weight:Height, data = sport_table)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.22475 -0.11244 -0.09795 -0.08142 0.94643
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.843e-02 7.966e-03 6.080 1.23e-09 ***
## SexM -4.128e-02 4.892e-03 -8.437 < 2e-16 ***
## Weight:Height 6.529e-06 6.918e-07 9.438 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.3034 on 20950 degrees of freedom
## Multiple R-squared: 0.005257, Adjusted R-squared: 0.005162
## F-statistic: 55.36 on 2 and 20950 DF, p-value: < 2.2e-16
Le ginnaste pesano circa 50 Kg e sono alte circa 158Kg. I ginnasti pesano circa 65Kg e sono alti circa 168cm.
Figura 13
Ancora una volta questi valori tendono ad essere costanti su più anni e a non influire sulla variabilità delle medaglie vinte. Sinonimo di essere requisiti che tutti gli atleti di questa categoria possiedono.Per cui il modello non risulta essere significativo.
Figura 14
##
## Call:
## lm(formula = medaglie ~ Sex + Weight:Height, data = sport_table)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.2996 -0.2127 -0.1823 -0.1373 0.9198
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.224e-01 5.170e-02 8.170 4.70e-16 ***
## SexM 1.017e-01 2.324e-02 4.377 1.25e-05 ***
## Weight:Height -3.050e-05 6.343e-06 -4.808 1.61e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.3948 on 2675 degrees of freedom
## Multiple R-squared: 0.009186, Adjusted R-squared: 0.008445
## F-statistic: 12.4 on 2 and 2675 DF, p-value: 4.359e-06
Notiamo che ognuna di queste tre categorie ha comunque peso e altezza specifici e differenziati.
Ho estrapolato dai dati le nazioni la cui capitale ha ospitato Olimpiadi estive.
Nel seguente grafico i pallini colorati stanno ad indicare il numero di medaglie vinte da ciascuna nazione quando giocava in casa e le linee la storia (in termini di medaglie vinte) negli anni in cui non era sede olimpica. La storia olimpica di ogni nazione è indicata da linee tratteggiate di diverso colore.
Osserviamo che i pallini sono tutti sopra le linee quindi giocare in casa favorisce la nazione.
| Name | Age | Year | NOC | Sport | Event | Medal |
|---|---|---|---|---|---|---|
| Dimitrios Loundras | 10 | 1896 | GRE | Gymnastics | Gymnastics Men’s Parallel Bars, Teams | Bronze |
| Name | Age | Year | NOC | Sport | Event | Medal |
|---|---|---|---|---|---|---|
| John Quincy Adams Ward | 97 | 1928 | USA | Art Competitions | Art Competitions Mixed Sculpturing, Statues | Nessuna |
Emerge che per alcuni anni si sono tenute competizoni artistiche che coinvolgevano esponenti della letteratura,pittura,musica,scultura ecc…
Approfondiremo nel prossimo punto!
Mentre l’atleta più anziano è:
| Name | Age | Year | NOC | Sport | Event | Medal |
|---|---|---|---|---|---|---|
| Oscar Gomer Swahn | 72 | 1920 | SWE | Shooting | Shooting Men’s Running Target, Single Shot | Nessuna |
| Event |
|---|
| Art Competitions Mixed Literature |
| Art Competitions Mixed Music |
| Art Competitions Mixed Sculpturing |
| Art Competitions Mixed Architecture |
| Art Competitions Mixed Painting |
| Art Competitions Mixed Architecture, Designs For Town Planning |
Le città che hanno ospitato tali competizioni sono state le seguenti:
| Year | City |
|---|---|
| 1912 | Stockholm |
| 1920 | Antwerpen |
| 1924 | Paris |
| 1928 | Amsterdam |
| 1932 | Los Angeles |
| 1936 | Berlin |
| 1948 | London |
Gli italiani che hanno vinto competizioni artistiche:
| Name | Sex | Age | Team | Year | Season | City | Event | Medal |
|---|---|---|---|---|---|---|---|---|
| Richard Barthlemy | M | NA | Italy | 1912 | Summer | Stockholm | Art Competitions Mixed Music | Gold |
| Raniero Nicolai | M | 26 | Italy | 1920 | Summer | Antwerpen | Art Competitions Mixed Literature | Gold |
| Carlo Giovanni Battista Pellegrini | M | 45 | Italy | 1912 | Summer | Stockholm | Art Competitions Mixed Painting | Gold |
| Giani Stparich | M | 57 | Italy | 1948 | Summer | London | Art Competitions Mixed Literature, Epic Works | Gold |
| Farpi Vignoli | M | 28 | Italy | 1936 | Summer | Berlin | Art Competitions Mixed Sculpturing, Statues | Gold |
| Name | Sex | Age | Height | Weight | Team | City | Sport | Event | Medal |
|---|---|---|---|---|---|---|---|---|---|
| Michael Fred Phelps, II | M | 31 | 193 | 91 | United States | Rio de Janeiro | Swimming | Swimming Men’s 4 x 100 metres Freestyle Relay | Gold |
| Michael Fred Phelps, II | M | 31 | 193 | 91 | United States | Rio de Janeiro | Swimming | Swimming Men’s 4 x 200 metres Freestyle Relay | Gold |
| Michael Fred Phelps, II | M | 31 | 193 | 91 | United States | Rio de Janeiro | Swimming | Swimming Men’s 100 metres Butterfly | Silver |
| Michael Fred Phelps, II | M | 31 | 193 | 91 | United States | Rio de Janeiro | Swimming | Swimming Men’s 200 metres Butterfly | Gold |
| Michael Fred Phelps, II | M | 31 | 193 | 91 | United States | Rio de Janeiro | Swimming | Swimming Men’s 200 metres Individual Medley | Gold |
| Michael Fred Phelps, II | M | 31 | 193 | 91 | United States | Rio de Janeiro | Swimming | Swimming Men’s 4 x 100 metres Medley Relay | Gold |